智能论文笔记

ExClus: Explainable Clustering on Low-dimensional Data Representations

Xander Vankwikelberge , Bo Kang , Edith Heiter , Jefrey Lijffijt

分类：机器学习

2021-11-04

通常用于分析复杂数据集的维度减少和聚类技术，但它们的结果通常不容易解释。我们考虑如何支持用户在散点图上解释视表位结构，其中轴不直接解释，例如使用维度减少方法将数据投射到二维空间上。具体地，我们提出了一种新方法来自动计算可解释的聚类，其中说明在原始的高维空间中，并且群集在低维投影中相干。它通过使用信息理论提供复杂性和所提供信息量之间的可调平衡。我们研究了这个问题的计算复杂性，并对解决方案的搜索空间引入了高效，可调，贪婪优化算法的限制。此外，该算法还在称为excus的交互式工具中实现。几个数据集的实验突出显示，excrus可以提供信息丰富的和易于理解的模式，并且他们公开了算法有效的地方，并且考虑到可调性和可扩展性的余地有改进的空间。

translated by 谷歌翻译

许多用户转向记录检索系统（例如搜索引擎）以寻求有争议的问题的答案。回答此类用户查询通常需要识别Web文档中的响应，并根据其不同的视角汇总响应。经典文档检索系统在为用户提供一系列直接和不同的响应时下降。当然，识别文档中的此类答复是一种自然语言理解任务。在本文中，我们研究了用文件检索综合这种语言理解目标的挑战，并研究了一个新的视角导向文档检索范式。我们讨论并评估内在的自然语言理解挑战，以实现目标。在设计挑战和原则之后，我们展示并评估了一个实用的原型管道系统。我们使用原型系统进行用户调查，以便评估我们的范例的效用，并理解用户信息需要有争议的查询。

translated by 谷歌翻译